Analisi sui brani musicali digitali
utilizzando strumenti software comunemente disponibili in rete (sia gratuiti
che a pagamento).
Premessa importante: Le analisi strumentali di questo tipo NON POSSONO e NON DEVONO sostituire l’ascolto. In fin dei conti, l’ultimo giudice è l’orecchio.
Tuttavia, le analisi strumentali forniscono molte informazioni utili per capire “come” è stata effettuata la ripresa musicale ed aiutano a comprendere la qualità globale del trattamento che ha avuto la musica durante l’acquisizione, l’elaborazione in studio e l’editing finale (ad es. è possibile verificare la presenza di compressione, limitazione, saturazione etc. nel messaggio sonoro).
Inoltre, solo con le analisi strumentali si possono identificare eventuali problemi di qualità causati dalle apparecchiature digitali utilizzate.
Infine, certe analisi possono indicare con ottima probabilità se una registrazione dichiarata ad alta risoluzione nativa (HD) è in realtà stata ottenuta da una sorgente musicale non HD: ad esempio, un file da 88.2 kHz / 24 bit potrebbe in effetti essere stato “confezionato” a partire da una registrazione in standard CD (44.1 kHz / 16 bit) o persino, in casi estremi, da un file MP3.
In rete sono disponibili alcuni software per effettuare differenti tipi di analisi. Vediamo come comprendere ed interpretare le misure ricavate da quelli che attualmente sono i software più utili e completi.
1. MusicScope
2. DR Meter
(plugin per Foobar 2000)
3. Lossless Audio
Checker (di
prossima pubblicazione)
4. MasVis (di
prossima pubblicazione)
5. Spek (di
prossima pubblicazione)
1.
MusicScope (The Music
Microscope)
E’ un programma prodotto dalla XiVero GmbH. Si lancia il programma, si carica il file audio da analizzare, si fa partire l’analisi ed il risultato viene presentato sotto forma di una pagina contenente una serie di informazioni, sia testuali che grafiche.
L’area in alto a sinistra serve ad identificare il tipo di file audio digitale (PCM o DSD), il suo formato (WAV, FLAC, DSF, MP3 etc.), la sua risoluzione in bit (1, 16, 24 etc.) e la sua frequenza di campionamento in kHz (44.1, 96, 512 etc.).
Nell’esempio seguente, il file analizzato è di tipo WAV a 192 kHz e 24 bit.
Alla sua destra troviamo un’area con l’indicazione dei vari livelli misurabili per il brano.
Spiegazione dei vari termini utilizzati:
TPL = True
Peak Level:
Indica il livello di picco massimo raggiunto da ogni canale.
Per valori sotto lo 0 dBFS (DeciBel Full Scale), sia le cifre indicate a
sinistra che le barre a destra sono in verde; se sono in rosso significa che
tra un campione e l’altro sono avvenuti dei picchi superiori a 0 dBFS, che
quasi certamente hanno causato distorsione.
Nell’esempio in figura, il canale sinistro ha un livello di picco di -3.0 dB ed
il destro di -2.0 dB.
RMS = Root
Mean Square:
Indica il livello effettivo del brano per ogni canale, mediato a 400 ms.
Le cifre a sinistra corrispondono alla posizione delle due sottili barrette
orizzontali di colore verde chiaro inserite all’interno delle due barre
verticali verdi. In questo tipo di misura, la relazione tra il livello di picco
ed il livello RMS è tale per cui una singola frequenza sinusoidale a 0 dBFS
corrisponde ad un livello RMS di -3 dBFS e perciò ad un fattore di cresta di 3
dB.
Nell’esempio in figura, il canale sinistro ha un livello RMS di -21.3 dB ed il
destro di -18.9 dB
CREST:
Indica il fattore di cresta del brano in dB (relazione tra il livello di
picco ed il livello RMS). Una sinusoide pura ha un fattore di cresta di 3 dB,
un’onda quadra di 0 dB.
E’ un ottimo indicatore della dinamica reale di un brano musicale; un brano
fortemente compresso o limitato superiormente in dinamica può avere un fattore
di cresta anche inferiore a 4 dB, mentre una registrazione effettuata a regola
d’arte, senza limitazioni e con scarsa o nulla compressione dinamica può
offrire valori anche ben superiori a 10 dB.
PLR =
Peak-to-Loudness Ratio:
Indica la relazione tra il livello di picco ed il “loudness” in dB e serve
a visualizzare la dinamica momentanea espressa durante l’esecuzione e l’analisi
di un brano musicale. E’ una misura che si utilizza soprattutto per determinare
il livello complessivo del brano per capire quanto “forte” suonerà, in
confronto ad altri brani con caratteristiche simili.
Nell’esempio in figura, il PLR (in colore azzurro, sia nella cifra a sinistra
che nella sottile barra verticale sopra le due barre verdi di livello) è di 8.0
dB.
Le quattro misure di livello contenute in questa sezione
sono principalmente indirizzate ai broadcaster, in quanto rispecchiano gli standard
R128 della EBU (European Broadcasting Union) e BS-1770 della ITU-R
(International Telecommunication Union - Radiocommunication).
L’algoritmo che calcola il Loudness (intensità sonora percepita) considera la
fisiologia dell’orecchio umano e perciò fornisce un’indicazione più precisa del
semplice valore RMS.
Il valore di loudness è fornito per quattro modalità di misura, in funzione del
tempo di integrazione:
M =
Momentary Loudness:
Tempo di integrazione 400 ms
S =
Short-term Loudness:
Tempo di integrazione 3 s
I =
Integrated Loudness:
Il loudness medio dell’intero brano musicale
LRA =
Loudness Range:
La dinamica complessiva dell’intero brano musicale
LU =
Loudness Units
Ha lo stesso significato di LUFS (Loudness Units Full Scale); è un’integrazione
delle misure M e S suddette.
E’ indicata dalla spessa barra azzurra a destra delle due barre verdi del
livello.
Il grafico verticale sulla destra (istogramma del loudness) fornisce la distribuzione energetica del brano. Può essere commutato in tre modalità: S-Mode (Short-Term Loudness) / M-Mode (Momentary Loudness) / TPL (True Peak Level).
Le prime due modalità (S-Mode e M-Mode) visualizzano la distribuzione energetica della musica con tempo di integrazione lento (3 secondi per S-Mode) o medio (400 millisecondi per M-Mode).
Nella modalità TPL (True Peak Level) si può visualizzare a colpo d’occhio l’entità delle eventuali compressioni e limitazioni di livello applicate al brano musicale. Se appare un picco nella zona intorno a 0 dB, è stata applicata una limitazione. Il canale sinistro è in verde, il destro in blu.
Nei tre esempi seguenti, il brano a sinistra non possiede nessuna compressione (la campana è omogenea e simmetricamente distribuita al centro del range dinamico, mentre i suoi estremi si “smorzano” sulla linea di base); quello al centro è leggermente compresso e con una limitazione minima (la campana è leggermente sbilanciata verso l’alto e la sua parte superiore non si “smorza” sulla linea di sinistra, ma si interrompe al livello di limitazione definito dal tecnico del suono); infine, il brano di destra è abbastanza compresso e pesantemente limitato (la campana non è simmetrica ma è sbilanciata verso l’alto, ed in più tutta la sua zona superiore è “schiacciata” intorno ai 0 dB).
Nell’area dove vengono visualizzati i livelli si può analizzare anche il modo in cui i bit a disposizione sono stati utilizzati.
Per i brani DSD la visualizzazione non è possibile, essendo questi composti da un solo bit.
La linea principale in alto mostra tante barrette verticali quanti sono i bit a cui il brano PCM è stato campionato (16, 24 o 32); l’LSB (Least Significant Bit - bit meno significativo) è a sinistra, l’MSB (Most Significative Bit - bit più significativo) è a destra.
Differenti gradazioni di grigio indicano l’utilizzo in bit. I bit non utilizzati sono colorati in blu.
Brano a 16 bit Brano a 24 bit
La “cascata” al di sotto della linea superiore visualizza in sequenza l’utilizzo progressivo dei bit durante l’esecuzione del brano.
In linea di massima, la distribuzione risulterà omogenea sia nella linea orizzontale superiore che nella sequenza temporale inferiore. Nella zona inferiore è possibile identificare eventuali bit bloccati, o pattern regolari di bit che possono indicare un’azione di up-sampling o anche problemi tecnici nella catena di registrazione (sia hardware che software).
Il diagramma circolare di quest’area contiene parecchie informazioni sull’evoluzione e sulla dinamica del brano. L’inizio è in alto (ore 12) e l’andamento procede in senso orario fino a ritornare alla posizione di partenza.
La traccia verde indica il valore di picco che assume il brano durante l’ascolto; la traccia arancione indica il valore di loudness short-term; la traccia azzurra, quando presente, indica il valore di PLR (Peak-to-Loudness Ratio).
Il brano di musica classica qui sopra, ad esempio, possiede un’eccellente dinamica: il suo valore di picco varia tra 0 dB e -30 dB, mentre il loudness short-term varia tra -12 e -35 dB. Il PLR medio è di circa 8 dB.
Se la traccia verde diventa rossa durante il suo sviluppo (come nell’esempio seguente, relativo ad un brano di musica rock), significa che in quei punti i picchi di livello tra due campioni adiacenti hanno superato lo 0 dB. Quando questo succede per un certo tempo o per periodi ripetuti, la distorsione diventa avvertibile.
L’area in alto a destra contiene al suo centro il vettorscopio, che indica il contenuto in fase del brano musicale e può anche servire ad analizzare l’immagine stereo che verrà riprodotta dai diffusori .
L’area verde centrale dovrebbe essere omogenea e distribuita simmetricamente dall’alto in basso, espandendosi verso i lati orizzontali. La barra in basso mostra la compatibilità con l’ascolto in mono del brano e la barretta bianca verticale indica la localizzazione delle singole sorgenti all’interno dell’immagine stereo. Più la barretta è situata verso destra e migliore è la localizzazione, poiché la parte decorrelata del segnale stereo è in questo caso ridotta.
Nei due esempi qui sopra, in entrambi i brani il contenuto in fase è corretto (omogeneo e distribuito simmetricamente tra sinistra e destra). Comunque nel brano di sinistra la separazione stereo è elevata, mentre nel brano di destra la separazione è scarsa (l’ascolto sarà quasi mono). La barretta bianca, situata sempre nella zona verde, indica che la compatibilità mono di entrambi i brani è ottima.
Così invece si presentano un brano mono (area verde centrale
inesistente, interamente verticale in quanto non esistono componenti stereo;
barretta bianca tutta a destra) ed un brano stereo con i due canali in
opposizione di fase (area verde centrale inesistente, interamente in
orizzontale in quanto esistono solo componenti stereo ma nessuna in comune ad
entrambi i canali; barretta bianca tutta a sinistra nell’area rossa).
Brano monofonico Brano stereo con i canali in opposizione di fase
Nell’area centrale della pagina viene visualizzata l’analisi di spettro del contenuto musicale del brano; la scala può essere lineare o logaritmica. La scala lineare è più indicata con le registrazioni in alta risoluzione, per valutare in dettaglio il contenuto spettrale dopo i 20 kHz. La scala logaritmica mette più in evidenza la parte inferiore delo spettro (basse frequenze).
Scala lineare: Spettro di un’ottima registrazione a 96 kHz/24 bit.
La stessa registrazione su scala logaritmica.
Lo spettrogramma è una rappresentazione della risposta in frequenza in funzione del tempo; in pratica, permette di vedere come cambia il contenuto spettrale della musica mentre si ascolta il brano.
E’ utile per identificare segnali che non variano durante lo svolgimento della musica come ad esempio ronzii di fondo, spurie ad alta frequenza, armoniche ripetitive, artefatti provenienti da elaborazioni digitali del segnale, etc.
Nel caso delle registrazioni ad alta risoluzione, diventa un ottimo strumento per valutare la presenza di componenti musicali realmente esistenti oltre i 20 kHz.
Questo ad esempio è lo spettro di un’ottima registrazione HD a 88.2 kHz / 24 bit. Il brano inizia in alto, in corrispondenza dello zero sulla scala di sinistra e prosegue fino al termine (100). Il principale contenuto energetico della musica è distribuito nei primi 4-5 kHz (nell’area arancione che diventa poi gialla); le armoniche principali degli strumenti musicali continuano ad essere presenti fino a circa 16-17 kHz (area verde), poi le ulteriori armoniche continuano fino a 40 kHz circa (area azzurra), smorzandosi poi nel rumore di fondo (area blu).
Di seguito vediamo invece una registrazione HD “discutibile”: nonostante anche questa sia stata effettuata a 88.2 kHz / 24 bit, si nota che il contenuto musicale si smorza di colpo a 21 kHz e rimangono solo tracce di probabili componenti di distorsione in alcuni punti del brano (le linee azzurre che proseguono da 21 kHz a 40 kHz circa).
Nello spettrogramma è possibile sovrapporre l’analisi COF (Cut-Off Frequency), per identificare con buona approssimazione il punto in cui le armoniche musicali si smorzano ad un livello così basso da confondersi col rumore di fondo. Ad esempio, nel brano seguente le componenti musicali non sono più presenti da circa 35 kHz in poi (cioè nella zona dove la curva gialla incontra la riga bianca orizzontale e viene sovrapposta una riga rossa).
2.
DR Meter (plugin per
Foobar 2000)
La misura del “DR” (Dynamic Range) è l’unica che ha avuto una notevole diffusione nell’ambito delle analisi audio di nuova generazione; fornisce un indice della dinamica reale contenuta in un brano musicale, basandosi sui concetti illustrati dalla Pleasurize Music Foundation. La spiegazione teorica di come viene effettuata l’analisi DR è in questo documento ufficiale della Foundation.
Nell’ottica della Foundation, si considerano brani musicali ad alta dinamica quelli con un valore di DR di 14 o superiore, mentre un valore da 0 a 7 è indice di scarsa dinamica. I valori intermedi (da 8 a 13) sono considerati accettabili.
La sola misura del DR non è ovviamente sufficiente per indicare la reale “qualità” di un brano musicale; tuttavia negli ultimi anni il valore del DR è diventato un dato oggettivo condiviso dalla maggioranza degli operatori del settore. Ad esempio, il sito http://dr.loudness-war.info contiene un elenco di oltre 100.000 album a cui è stato misurato il DR. Per questo motivo è sempre utile riportarlo nelle varie analisi musicali, in aggiunta ad altre misure più complete ed a considerazioni oggettive e soggettive.
Uno dei modi più semplici per misurare il DR è quello di utilizzare il programma “Foobar 2000” ed installarvi l’apposito plugin.
Si caricano in Foobar i brani da analizzare, si selezionano uno o più brani (anche un intero album) e si clicca il tasto destro del mouse selezionando poi “Dynamic Range Meter”. L’analisi inizierà automaticamente ed al termine, nella cartella dove sono memorizzati i brani, verrà generato un file di testo di nome “foo_dr.txt” che conterrà queste informazioni:
foobar2000 1.3.15 beta 1 / Dynamic Range Meter
1.1.1
log date: 2017-03-26 23:45:14
--------------------------------------------------------------------------------
Analyzed: ? / ?
--------------------------------------------------------------------------------
DR
Peak RMS Duration Track
--------------------------------------------------------------------------------
DR18
-0.32 dB -23.73 dB 3:21 ?-01 - New Orleans Heartbreakers -
Dippermouth Blues
DR18
-0.23 dB -21.71 dB 2:48 ?-02 - New Orleans Heartbreakers - I'm
Getting Sentimental
DR20
0.00 dB -24.11 dB 4:36 ?-03 - New Orleans Heartbreakers -
The Glory Of Love
DR20
-0.22 dB -25.63 dB 4:47 ?-04 - New Orleans Heartbreakers -
I'm Putting All My Eggs In One Basket
DR19
-0.31 dB -23.22 dB 4:14 ?-05 - New Orleans Heartbreakers -
Chloe
DR18
-0.23 dB -21.59 dB 3:35 ?-06 - New Orleans Heartbreakers -
Laughin' Samba
DR21
-0.31 dB -25.63 dB 3:35 ?-07 - New Orleans Heartbreakers -
Meet Me Where They Play The Blues
DR20
-0.27 dB -25.70 dB 5:37 ?-08 - New Orleans Heartbreakers - I
Want To Be Happy
DR13
-1.55 dB -20.32 dB 4:45 ?-09 - New Orleans Heartbreakers -
What A Friend We Have In Jesus
DR20 -0.25 dB
-25.80 dB 5:28 ?-10 - New
Orleans Heartbreakers - There'll Be Some Changes Made
DR19
-0.27 dB -24.06 dB 3:13 ?-11 - New Orleans Heartbreakers -
Blues In The Air
DR21
-0.19 dB -26.84 dB 5:15 ?-12 - New Orleans Heartbreakers -
Girl Of My Dream
DR16
-0.58 dB -18.87 dB 2:56 ?-13 - New Orleans Heartbreakers -
Rum & Coca-Cola
DR18
-0.27 dB -22.33 dB 4:57 ?-14 - New Orleans Heartbreakers -
Oh' How I Miss You Tonight
DR18
-0.24 dB -24.93 dB 3:42 ?-15 - New Orleans Heartbreakers -
That's What I Like
--------------------------------------------------------------------------------
Number of tracks: 15
Official DR value: DR19
Samplerate: 44100 Hz
Channels: 2
Bits per sample: 16
Bitrate: 1411 kbps
Codec: PCM
================================================================================